GPT-5.3-Codex se entrenó a sí mismo: OpenAI lanza su modelo de IA más avanzado para programación

por Edgar Otero Ayer a las 08:19

El mismo día que Anthropic anunciaba Claude Opus 4.6, OpenAI ha lanzado GPT-5.3-Codex, su modelo de inteligencia artificial más avanzado para programación y tareas agénticas. La nueva versión no solo mejora las capacidades de programación de su predecesor GPT-5.2-Codex, sino que también integra el sistema de razonamiento de GPT-5.2 en un único modelo que opera un 25% más rápido.

Esto permite al sistema abordar tareas prolongadas que involucran investigación, uso de herramientas y ejecución compleja. Obviamente, este es un modelo pensado para vibe coding o el soporte en tareas relacionadas con la programación.

Una característica distintiva de este lanzamiento es que GPT-5.3-Codex fue el primer modelo de OpenAI que participó activamente en su propio desarrollo. El equipo utilizó versiones preliminares para depurar el entrenamiento, gestionar el despliegue y diagnosticar resultados de pruebas. Según la compañía, el modelo aceleró significativamente su propio proceso de creación.

Rendimiento superior en evaluaciones técnicas

GPT-5.3-Codex establece nuevos máximos en SWE-Bench Pro y Terminal-Bench 2.0, dos de las evaluaciones más exigentes para medir capacidades de ingeniería de software real. En SWE-Bench Pro, que evalúa cuatro lenguajes de programación y es más resistente a la contaminación de datos que versiones anteriores, el modelo alcanza un 56,8% de precisión. En Terminal-Bench 2.0 obtiene un 77,3%, superando ampliamente a GPT-5.2-Codex.

El modelo también destaca en OSWorld-Verified, una prueba que mide la capacidad de completar tareas de productividad en un entorno de escritorio visual, donde alcanza un 64,7% frente al 38,2% de su predecesor. En GDPval, una evaluación que mide el desempeño en 44 ocupaciones profesionales diferentes, GPT-5.3-Codex iguala el rendimiento de GPT-5.2, demostrando que sus mejoras en programación no afectan otras capacidades.

Más allá del código: un agente versátil

A diferencia de modelos anteriores centrados exclusivamente en programación, GPT-5.3-Codex puede realizar el espectro completo de trabajo profesional en un ordenador. El sistema es capaz de crear presentaciones, analizar datos en hojas de cálculo, realizar investigaciones y ejecutar tareas complejas que antes requerían múltiples herramientas especializadas. OpenAI demuestra esta versatilidad con ejemplos que incluyen análisis financieros, documentos de formación y presentaciones de moda.

El modelo permite la interacción en tiempo real mientras trabaja, proporcionando actualizaciones continuada sobre decisiones clave y progreso. Los usuarios pueden hacer preguntas, discutir enfoques y redirigir la solución sin que el sistema pierda el contexto de la conversación.

OpenAI ha clasificado a GPT-5.3-Codex como de capacidad alta en tareas de ciberseguridad, el primero bajo su marco de preparación. La compañía ha implementado salvaguardas que incluyen entrenamiento de seguridad, monitoreo automatizado y acceso confiable para capacidades avanzadas. Además, ha comprometido 10 millones de dólares en créditos de API para acelerar la defensa cibernética, especialmente en software de código abierto y sistemas de infraestructura crítica. El modelo está disponible en los planes de pago de ChatGPT.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!